Règles de propagation pour la création d'ontologies d'annotation de ressources
نویسندگان
چکیده
Résumé. L’annotation se distingue de l’indexation automatique par l’utilisation d’une ou plusieurs ontologies qui définissent un domaine global de référence permettant de cadrer et de normaliser les annotations effectuées, par ailleurs une ressource annotée doit l’être non pas par une liste de motsclefs, mais bien par une ou plusieurs ontologies. Malheureusement, il est peu réaliste de penser que les centaines de millions de ressources mises à disposition sur le Web puissent être annotées par leurs auteurs. Pour résoudre ce problème, notre démarche consiste à indexer les documents en se basant sur l’ontologie globale et ensuite propager les annotations en utilisant des documents déjà annotés pour annoter d’autres documents référencés par ceux-ci. La propagation des annotations suit des règles que nous proposons dans cet article. L’illustration est effectuée sur un corpus de livres dont le thème relève de l’informatique.
منابع مشابه
Indexation et intégration de ressources textuelles à l'aide d'ontologies : application au domaine biomédical
Résumé : De nombreuses découvertes scientifiques sont contraintes aujourd’hui par la difficile intégration des données misent à disposition dans différentes ressources. L’utilisation d’ontologies pour indexer et intégrer les ressources de données est un moyen de valoriser la connaissance d’un domaine en facilitant la recherche et la fouille de données. Dans cet article nous présentons un mécani...
متن کاملConstruction automatique d'ontologies à partir de spécifications de bases de données
Résumé : Les méthodes classiques de construction automatiques d’ontologies à partir de textes exploitent le texte proprement dit. Nous étendons ces approches en prenant en compte la structure du texte, élément porteur d’information. Pour cela, nous nous basons sur des documents de spécifications de bases de données au format XML, pour lesquels le découpage structurel du texte correspond à une c...
متن کاملLes défis posés par le Web sémantique
RÉSUMÉ. Le Web sémantique est une vision du Web de demain où l'interopérabilité entre les ressources distribuées sur le Web, aujourd'hui très hétérogènes, sera facilitée par un marquage sémantique de ces ressources à l'aide d'ontologies. Une ontologie est un vocabulaire structuré de noms de concepts et de propriétés définis précisément à l'aide d'un langage formel non ambigu. Dans la vision du ...
متن کاملAnalyses formelle et relationnelle de concepts pour la construction d'ontologies de domaines à partir de ressources textuelles hétérogènes
متن کامل
Exploitation de dictionnaires électroniques pour la désambiguïsation sémantique lexicale
RÉSUMÉ. Cet article présente un système de désambiguïsation lexicale sémantique, conçu initialement pour l’anglais et à présent adapté à la désambiguïsation du français. La méthodologie développée repose sur l’utilisation d’un dictionnaire électronique comme un corpus sémantiquement étiqueté afin d’en extraire une base de règles de désambiguïsation sémantique. Ces règles permettent d’associer à...
متن کامل